Guia de Programação CUDA: A Mudança para Computação Orientada ao Throughput

A computação passou por uma mudança fundamental de otimizada para latência projeto de CPU para orientada ao throughput arquiteturas de GPU. Enquanto uma CPU é como uma moto de entrega de alta velocidade (rápida para um único pacote), uma GPU é um imenso navio cargueiro: move-se mais devagar por item, mas carrega 50.000 contêineres de cada vez.

1. Latência versus Throughput

As CPUs são projetadas para minimizar o tempo de conclusão para uma única sequência de instruções usando previsão de ramificação sofisticada. Por outro lado, Unidades de Processamento Gráfico (GPUs) são projetadas para maximizar o trabalho por segundo executando milhares de threads em paralelo, sacrificando a velocidade individual por um throughput agregado enorme.

2. Alocação de Transistores

A GPU oferece muito maior throughput de instruções e largura de banda de memória do que uma CPU dentro de um envelope de preço e potência semelhante. As GPUs são especializadas em cálculos altamente paralelos e dedicam mais transistores a unidades de processamento de dados (ALUs), enquanto as CPUs dedicam mais transistores ao cache de dados e controle de fluxo.

3. A Evolução do CUDA

Arquitetura Unificada de Computação (CUDA) foi introduzido pela NVIDIA em 2006. É uma plataforma e modelo de programação paralela que permite aumentos dramáticos no desempenho aproveitando o poder da GPU independentemente das APIs gráficas.

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

Which component consumes the majority of silicon real estate in a traditional CPU?

Arithmetic Logic Units (ALUs)

Control logic and Data Caching

Floating Point Units

Memory Controllers

QUESTION 2

What was the original purpose of the GPU before CUDA?

General purpose scientific computing

Operating system kernel management

Fixed-function hardware for 3D rendering

High-frequency trading

QUESTION 3

In the cargo ship analogy, what represents the 'Throughput'?

The speed at which the ship moves across the ocean.

The total volume of containers delivered at once.

The size of the ship's engine.

The fuel efficiency per container.

QUESTION 4

What is the primary trade-off made by GPUs to achieve high aggregate throughput?

Higher power consumption per unit.

Lower single-thread performance.

Reduced memory bandwidth.

Simplified mathematical precision.

QUESTION 5

Which NVIDIA software component is required to run CUDA applications?

DirectX 12

NVIDIA Driver and CUDA Toolkit

OpenGL Wrapper

Windows GDI+